메뉴

#시스템 프롬프트

OA
r/OpenAI 31일 전
IMP 6

AI에 갑자기 '고블린'이 등장한 이유

OpenAI가 GPT-5.1 이후 모델들이 대답에 '고블린'과 같은 크리처 단어를 빈번하게 사용했던 원인을 분석한 결과, 'Nerdy(너드)' 성격 커스터마이징 기능의 강화 학습 과정에서 크리처 비유에 과도한 보상(Reward)이 부여된 것으로 드러났습니다. 이는 소비자에게 제공되는 AI의 페르소나와 미세한 보상 신호가 모델의 전반적인 동작과 언어 습관에 예기치 않은 방식으로 영향을 미칠 수 있음을 보여주는 중요한 사례입니다.

GPT-5 모델 행동 강화 학습
HN
Hacker News 32일 전
IMP 8

클로드 시스템 프롬프트 버그로 인한 비용 낭비 및 에이전트 중단 문제

앤스로픽의 개발자 도구인 Claude Code의 최신 버전에서 파일을 읽을 때마다 '악성코드' 경고 시스템 프롬프트가 삽입되는 버그가 재발했습니다. 이로 인해 합법적인 오픈소스 코드 작업 중이던 하위 에이전트들이 작업을 거부하고 멈춰버리는 현상이 발생하여, 병렬 작업의 40~60%가 실패하고 사용자의 API 비용만 낭비되는 심각한 문제가 야기되고 있습니다.

클로드 코드 버그 회귀 시스템 프롬프트
GP
r/ChatGPT 33일 전
IMP 6

GPT 5.5가 너구리, 도깨비, 비둘기 언급을 금지하는 이유

최근 유출된 GPT-5.5 시스템 프롬프트에서 특정 동물과 상상의 존재들(너구리, 고블린, 트롤, 비둘기 등)에 대한 언급을 엄격히 금지하는 지시어가 발견되었습니다. 사용자들은 이 같은 기이한 제한이 데이터 오염 방지 조치인지, 아니면 강화학습 과정의 부작용인지 추측하며 OpenAI의 의도에 의문을 제기하고 있습니다.

GPT-5.5 시스템 프롬프트 프롬프트 유출
HN
Hacker News 42일 전
IMP 7

클로드 오푸스 4.6→4.7 시스템 프롬프트 변화 분석

앤스로픽이 공개한 클로드 오푸스 4.7의 시스템 프롬프트 변경 사항을 심층 분석한 글입니다. 크롬, 엑셀, 파워포인트 등 신규 에이전트 도구가 추가되었고, 아동 안전 지침이 대폭 강화되었습니다. 또한 불필요한 질문을 줄이고 직접 문제를 해결하도록 지시하는 행동 중심의 프롬프트와 간결한 답변 유도를 위한 장문 억제 지침이 새롭게 도입되었습니다.

앤스로픽 클로드 오푸스 시스템 프롬프트